In [8]:
from sklearn.preprocessing import StandardScaler
X = np.array([[3,6], [6,7]])
#스케일러 객체 생성
scaler = StandardScaler()
#분포 추정
scaler.fit(X)
#스케일링
X2 = scaler.transform(X)
In [9]:
X
Out[9]:
In [10]:
X2
Out[10]:
In [11]:
X = np.array([[0, 2], [1, 1]])
X
Out[11]:
In [12]:
from sklearn.preprocessing import OneHotEncoder
OneHotEncoder().fit_transform(X).toarray()
Out[12]:
In [13]:
from sklearn.datasets import load_boston
boston = load_boston()
dfX0 = pd.DataFrame(boston.data, columns=boston.feature_names)
dfy = pd.DataFrame(boston.target, columns=["MEDV"])
In [14]:
dfX0.tail() #독립변수 DataFrame
Out[14]:
In [15]:
dfy.tail() #종속변수 DataFrame
Out[15]:
In [16]:
import statsmodels.api as sm
#augmentation
dfX = sm.add_constant(dfX0)
#모형 객체 생성
m = sm.OLS(dfy, dfX)
#추정 및 결과 객체 생성
r = m.fit()
#결과 객체에서 보고서 출력
print(r.summary())